Buffer
首页 博客 简历
← 博客

标签: Coding Agent

2 篇文章

  • Agentic RL:一篇大综述告诉你 RL 怎么把 Agent 从写死的脚本变成自适应系统

    2026-07-03

    25 位作者、500 篇参考文献、TMLR 发表。这篇 survey 形式化了从 LLM RL(RLHF/DPO)到 Agentic RL 的范式转变,并给出了以能力维度和任务域两条轴线的完整分类法。我们翻译并解读了核心框架和与 Coding Agent 最相关的部分。

    AgentRLSurveyTranslationCoding Agent
  • SWE-bench Verified 30 个月:从 1.96% 到 80.9%,Coding Agent 是怎么做到的

    2026-07-02

    30 个月,从 1/50 到 4/5。本文翻译并解读 AgentMarketCap 的 SWE-bench Verified 完整演进史,拆解每个跳变的驱动因子,以及在 saturation 之后该看什么。

    AgentBenchmarkSWE-benchTranslationCoding Agent

© 2026 Buffer. Built with Astro.